tg-me.com/TestFlightCN/24977
Last Update:
Anthropic昨晚《反思我们的责任扩展政策》的文章,回顾了其责任扩展政策(Responsible Scaling Policy,RSP)的实施情况:
Anthropic在去年夏天首次发布了RSP,旨在应对前沿模型的灾难性安全故障和误用问题。该政策的主要目标是将高层次的安全概念转化为快速发展的技术组织的实际指南,并展示其作为可能标准的可行性。
在实施过程中,Anthropic发现拥有明确的灾难性风险政策非常有价值。而政策的实施需要Anthropic各团队的密切合作,特别是在红队测试和威胁建模与评估方面。通过这种合作,风险缓解目标得到了显著改善。
未来Anthropic计划更新其RSP,并将在不久后分享新的版本。确保未来的前沿模型在训练和部署过程中负责任地进行,将需要Anthropic及整个行业和政府的重大投资。
X
关注频道 @ZaiHuaPd
频道投稿 @ZaiHuabot
🫥会员/Apple/Plus券合集️
BY 软件新闻频道📮投稿爆料
Share with your friend now:
tg-me.com/TestFlightCN/24977